查看原文
其他

赵宪伟、刘政、徐衍、刘品新、石青川、刘坤、顾伟、陈思远:海量电子证据如何审?

刘品新|网眼观法 司法兰亭会 2022-10-02

2022年3月30日下午,“电子证据与网络犯罪检察论坛”第二十讲在线上顺利举办。


此次讲座邀请到最高人民检察院检察技术中心科研处处长赵宪伟、北京市东城区人民检察院综合事务中心副主任刘政、杭州市人民检察院技术处四级调研员徐衍作为主讲人,以“检察技术论剑:海量电子证据如何审”为主题进行分享。


讲座围绕国内电子数据取证和审查的发展现状、电子数据审查工作面临的问题与挑战、电子数据审查的发展趋势以及电子数据审查的实现路径与方法等主题展开讨论。


期待通过梳理司法办案通用模型,研究司法诉讼对电子数据价值挖掘的精准需求场景,利用人工智能和大数据技术建立与完善检察办案审查证据的知识图谱,实现对电子数据蕴含诉讼价值的深度和高效挖掘。


本次讲座由中国人民大学法学院教授、博士生导师刘品新担任主持人,北京市东城区人民检察院第二检察部四级高级检察官石青川、天津市人民检察院知识产权检察办公室一级检察官刘坤、上海市徐汇区人民检察院第三检察部副主任、四级高级检察官顾伟、北京市昌平区人民检察院第八检察部(法律政策研究室)四级主任科员陈思远担任评议人。


第一环节

刘政:电子数据的“用”


刘政以《电子数据的“用”》为主题,围绕“数据难用”“审查困境”“检技配合”分享他对检察机关面对海量电子数据的困境认识与解决方式的研究。


一、数据难用


第一,看不到某案件的数据量甚至达到几十TB,量大不宜看;检察官没有有效的工具看;检察官没有意识看或者意识还没培养出来。


第二,搜不着。报告格式多样,提取的文件的类型繁多,量大且没有能够快速搜索的好用的工具。


第三,用不好拿过来的海量电子数据是一个宝库,虚拟空间蕴藏有大量未掌握的事实,但检察官往往难以从中获取与案件待证事实密切相关的有效信息。


二、审查困境


检察机关在数据难用的背景下办案面临的审查困境主要有:


第一,装备落后,难以满足正常工作需要。第二,海量电子数据审查与审限紧张的矛盾。第三,检察官审查电子数据缺乏指引。第四,运用电子数据敏感度低。第五,检察机关专业技术人员配备薄弱、水平参差。第六,公检法刑事诉讼领域对电子数据认知、理解、关注点上存在差异。


三、检技配合


刘政指出,解决这个困境目前来说最直接也最容易实现的是检技配合,要从机制保障、人员配齐、观念转变、建立互信、工具完善等方面来打破这个困境,更好审查海量电子数据。


(一)机制保障


相关规定见于《人民检察院刑事诉讼规则》第5条、《最高人民检察院关于指派、聘请有专门知识的人参与办案若干问题的规定(试行)》、《人民检察院办理网络犯罪案件规定》第8条等,以及《人民检察院办理网络犯罪案件规定》第12条、第16条、第23条、第25条、第46条和第47条分别展现引导取证、补充侦查、对电子数据等进行专门审查、自行侦查的技术协助、多媒体示证及动态演示等方面检察技术人员可以发挥的作用。


北京市检察院制定的《北京市检察机关专业同步辅助审查工作指南》明确了检察技术人员参与办案可以开展哪些工作、怎么干、怎么配合,尤其在电子数据门类中规定由具备电子数据取证审查专业技能的人员配合办案。


监察体制改革后,东城区检察院成立了“网络电信犯罪检察部”专业化办案部门,三名具备电子数据鉴定资质的技术人员被编入了办案组,配合进行案件办理,辅助开展电子数据的审查运用。


(二)转变观念与人员配齐


监察体制改革后有些人关于技术人员的技能随着检察院自侦案件减少而没有意义的观念要尽快转变。


目前检察技术配合刑检开展电子数据审查工作,工作形式和工作内容都面临甚至比原来更多的未知挑战,且配合更为多元化,价值并未减少;而且面临技术人员流失的现状,就需要把能够从事电子数据辅助审查工作的技术人员配齐,这是开展工作的基础。


检察技术工作量占比最大的就是技术协助,而在技术协助的种类中开展工作最多的一项就是海量电子数据的分析往往是发现潜在证据并开展后续工作的利器。


(三)建立互信


刘政回忆在检察官学院讲课时,有些检察官的提问表现出他们对检察技术辅助办案的职能十分陌生——这就无法建立互信。需要检察技术人员从某个点切入,在个案中与检察官良好配合与沟通,在接下来的工作中才能形成双向的互动,而不是单向的奔赴。


刘政以东城区检察院或其本人参与的案件举例说明检察技术人员在电子数据审查方面发挥的重大效用。


在某非法吸收公众存款案中,侦查机关移送的电子数据体量是4.5TB,检察官希望确定其中51份EXCEL表格具体的来源为何台电脑,对每一个鉴定提取的光盘中进行数据比对根本不现实;技术人员则将51份EXCEL表格的哈希值制作了哈希列表,与鉴定机构提取的4.5TB电子数据进行哈希比对,很快就完成了溯源


(四)工具完善


刘政希望商家可以在已经成熟的电子数据的“取”的基础上,在电子数据的“用”的方面再投入一些。


专属的审查工具的基本功能应有浏览、搜索、标记、统计,可以兼容手机报告、聊天记录,同时可以导入各种各样的文件,如公民个人信息、通讯和组织关系、资金和交易关系、网络流量和日志、文档型数据等。


另外,能够实现即时通讯的语音转文字并完成搜索的功能,或者不需转文字而对语音进行搜索的功能;实现智能搜索、各种统计和语义分析。


除此以外,审查工具还应当具有的辅助功能有(1)反映主体身份的内容(嫌疑人、受害者、其他相关人等);(2)反映客观行为的内容(掩饰行为、实施行为、咨询行为等);(3)反映主观故意的内容(证明明知);(4)反映犯罪后果和犯罪情节的内容(犯罪数额、规模等)


根据面向群体的不同,理想的审查工具分为“轻量级”和“旗舰版”。作为审查主体的检察官使用的“轻量级”工具兼容各厂商出具的多样取证报告导入,可以便捷实现搜索、标记等功能。


技术人员使用的“旗舰版”工具实现通联分析、账单分析、个人画像等全部功能。工具之间还能实现互动,比如检察官提出更为复杂的专业化、专门性的需求,技术人员可以使用更为高阶的工具分析、搜索,得到结果并返回检察官。


刘政最后总结几点感悟


第一,电子数据中蕴含着大量的有价值的信息,是一座宝库,绝对不要轻易放弃对电子证据的审查。第二,电子数据是有温度的,我们要用就要让它“活”起来,相当于要让电子数据所有者坐在面前和自己对话。第三,技术人员在业务层面编入检察官办案组的“检察+技术”是一种比较不错的模式。技术人员在辅助检察官审查运用科学证据的同时也提升了自己的办案能力并积累经验。第四,海量电子数据的审查模式要实现从人工到“人工+智能”的模式。即使工具非常完善,也不要忽视人的主动审查判断。



第二环节

徐衍:电子数据审查的三种思维


徐衍以《电子数据审查的三种思维》为题分享了他对电子数据审查积累的一些思考。


一、“定位”思维


检察技术的价值体现在哪里?检察技术的核心竞争力是什么?徐衍首先提出这两个问题引发大家的思考。


徐衍强调,检察技术人员不是什么杂活都做的行政人员,那并不能体现检察技术人员的核心竞争力,而是作为检察辅助人员支持业务办案、辅助业务办案,核心竞争力应体现在检察业务上。


徐衍期待,未来公安同志向检察官汇报案件时也会到检察技术部门来。现在杭州的几个基层检察院已经做到了这一点,负责电子物证的网警会和检察院的案件承办人一起在检察技术人员的办公室里讨论案件,这与杭州近年来比较重视电子数据图像鉴定等方面密切相关。


二、“融合”思维


检察官和技术人员在办案组的具体工作有“分”也有“合”。“分”即分工,特别是《人民检察院办理网络犯罪案件规定》对二者的分工职责作出了明确的规定。“合”即合作,分工并不代表二者存在严格的分界,例如在案件讨论方面,技术人员和业务人员都要了解对方的工作内容。


徐衍特别强调,技术人员需要认真研究刑法尤其关于计算机犯罪的几个章节,技术部门介入后检察官可以更准确地对案件进行定性。


例如,“破坏”“侵入”“控制”“非法获取数据”等关键词的含义有不同的规定,检察技术人员需要与检察官讨论清楚让其理解,检察官才能作出更合适的定性。


徐衍介绍了一个技术部门和业务部门合作的典型成功案例:全国首例微信解封入罪案——杭州市上城区公安、杭州市检察院和上城区检察院共同成立了办案小组,由于微信解封涉及技术流程,检察官充分听取了技术部门的意见,在补充侦查提纲中采纳了技术方面的专门意见和思路。


技术部门的技术审查思路主要考虑了两个难点:一是对公安移交的电子数据进行规范性和实质性的审查,包括如何确定嫌疑人的犯罪主观故意;二是如何证明作为财务的同案犯对犯罪事实知情。


检察技术人员开启了自行补充侦查,对补充侦查的方向专门和检察官进行讨论:通过侦查实验确定了犯罪嫌疑人的主观故意,通过人物数据画像,还原了投射在电子数据中的事实行为,确认犯罪时间和管理财物的事实,并深度恢复以提取关键证据某文档,确定了其对犯罪事实的主观明知。


最终由于该案证据固定明确,各嫌疑人在法院判决后均未上诉。


技术部门和业务部门配合可以取得双赢的结果。很多检察官并非不想找技术部门而是不知道要找,直接相信鉴定机构或公安提供的报告而没有实际审查其中可能存在的问题。


技术人员找到机会与检察官合作办几个案件,使检察官明白技术人员的价值,从而形成良性循环。


三、“三查”思维


 “定位”思维解答“该干什么”,“融合”思维解决“怎么干”,“三查”思维则旨在分析具体可以做些哪些事情。


(一)审查思维


徐衍指出,为了落实“大控方”的格局,最终让证据到法院开庭审理时没有瑕疵,不要认为每一份电子取证报告或技术协助报告都规范,检察人员同样需要对这些报告细心审查。


例如某图像鉴定报告中附有文件的哈希值,但自己校验之后就发现根本对不上,且该案件已经到二审阶段都没人发现;又或许有些应做哈希校验值而没有做或漏做,又或做哈希校验的方法不对等,都需要技术人员多留心注意。


(二)调查思维


事实基本清楚的情况下,检察机关如何再围绕该事实固定证据、提取证据或形成证据链——有些领导认为这是公安机关的任务,但徐衍认为,检察机关本身有自侦权,且技术部门的优势在于和业务部门的同志们距离最近且可以实时交流,最高检也特别强调自行启动补充侦查的重要性。


徐衍以李某等15人诈骗案为例,展示了审查海量证据的一个角度。


李某等15人搭建了虚假的贷款平台,通过电话和微信方式告知被害人可以办理网络贷款,然后以支付会费、保证金、解冻金等名义实施诈骗。经过检察院自行补充侦查,诈骗金额从受理时的32万提高到最终判决认定的395万,被害人由30人增加到202人,主犯的量刑区间幅度发生质的飞跃,且案件的认罪认罚率和量刑采纳率都是100%,没有人上诉,可见该案的证据固定工作做得非常好。


该案的难点在于:

主观证据方面,犯罪嫌疑人无法准确说清诈骗了哪些人、诈骗金额供述反复、在检察官提审时避重就轻;诈骗团伙与收款银行卡的控制关系较为淡薄,仅有口供。

客观证据方面,三名侦查人员花了两个月时间才将本案电子数据提取完成,侦查机关未对提取出的142份电子数据、16卷报告进行分析。面对海量的电子数据,检察官第一时间委托了技术人员介入,成立了电子证据的审查分析工作小组,将海量数据化整为零。


因为存在检材数据的交叉,首要的工作就是进行数据清洗。经过重复数据的检测和消除、甄别不一致的数据检测及解决冲突、运用数字化分析技战法解析数据特征,最终将17GB的数据浓缩为三张表格。


徐衍介绍,在最高检技术信息研究中心贺德银副主任的指导下,杭州市上城区检察院正在进行自主研发的“电子证据可视化分析平台”的试点。这个平台研发的初衷就是为了在海量数据中通过建模或高级搜索方式发现规律,第一时间找到并整理出所需要的东西。


平台分为两个对象,在业务人员端即检察官端,可以看到技术人员提供的较有价值的初步报告并进行摘录工作;在技术人员端则有很多特别功能如正则、建模、人物画像、犯罪模型、以案件时间轴进行数据清洗等等。技术人员通过该平台的初筛,为检察官减少了很多工作量。


(三)侦查思维


徐衍指出,这里的“侦查”不同于前面讲的自行补充侦查,而是在还不知道犯罪事实的情况下如何找到线索进行立案监督或对案件改变定性等。侦查思维对学工科的检察技术人员来说不是难事,关键是要有将侦查意识纳入电子数据审查的思维转变。


徐衍以储某职务侵占案件为例展示了一个典型的反向侦查案件。从侦查机关移送的事实来看,嫌疑人储某是典型的职务侵占行为,主要证据是他人的口供指认,但通过公诉部门与技术部门联合开展自行补充侦查,发现所提取的电子数据存在许多反向的证据,最终予以不起诉处理。这是以典型的侦查方式还原案件事实,从而避免了一起冤假错案。


徐衍介绍的另一个案例是周某假币案。周某通过快递寄假币的少量样品被发现,其后检察技术部门对公安扣押的周某的电脑和手机展开补充侦查,在其电脑中恢复发现了存有假币的样版和制造假币的方法。


随着聊天记录等数据的进一步破解,检察官发现原先被认为是一个下游人员的周某其实是团伙的首要人物,进而改变了案件事实的定性和补充了相应罪名。



第三环节

赵宪伟:海量电子数据审查的实现路径


赵宪伟从其与前两位主讲人合作撰写的《海量电子数据审查的实现路径》论文最后提到的关于对海量电子数据结合人工智能的算法和方案展开,讲述一些助力解决检察官审查判断海量电子数据困境、寻求提高效率的方法。


(一)检察官某些需求难以能够分解为现有取证工具软件里的具体化操作,如何应对?


赵宪伟举例,比如检察官想要检索某取证报告中有没有包括所有某省的地址、想了解两个犯罪嫌疑人共同参加了哪些微信群、想知道某人在某一天的下午两点在哪里和做什么、想知道某人在微信聊天记录里有没有提到某一个人的代号、简称等……


这些需求很难用关键词或正则检索到位。现行细化为一些技术操作的筛选方式有些复杂,他期待有一个较为智能化的平台通过编写脚本的方式,可以实现一键完成。


(二)对于海量的聊天记录,如何尽可能提高适用效率?

赵宪伟展示了这张其论文关于人工智能的图片。以海量聊天记录为例,通过对每一条聊天记录在时间、空间、行为上的分解,以及对所有聊天记录的积累,结合已经形成的一些规则体系和实体识别体系等,能够对案件涉及的所有聊天记录进行输出,从聊天记录里找到尚未发现的潜在受害者,以及犯罪嫌疑人的主观故意、是否有团伙作案的嫌疑、有无犯罪后毁灭证据、销赃、联系等一系列行为,并通过电子数据将其定位并支撑检察官指控和在法庭上简明扼要地示证。


根据生活常识的简单判断规则,可以将占比高达百分之几十的广告信息从手机取证报告的筛选结果中排除,“瘦身”后的电子取证报告才方便检察官审查和定位关键信息。


同时,通过实体识别技术对自然语言语义的理解,运用机器学习技术,筛选出行为人之间真正的社交信息并将每一条聊天内容分解输出为不同性质的实体信息,如姓名、地址、时间、行为、顺序等并将其打上标签,进而将所有账号内的信息输出为实体库,解构为与各种专题有关的案件小库。


(三)检察官审查判断时是否具备条件部署这样的人工智能算法?


赵宪伟指出答案是具备的。提请逮捕意见书、起诉意见书等非结构化的法律文书和结构化的针对一个案件所要填写的数百个案卡项是检察官日常工作的核心内容。


手机取证报告则是一份典型的半结构化数据,形式上表现为一个电子文件的报告,内容又有很多结构化的信息如发送者、发送时间、发送内容等等。那么对于这样的半结构化信息就可以至少利用其文本数据作为实体识别的输入信息,经过人工智能算法输出很多实体结果,利用已经填的结构化的案卡信息与算法输出的结果进行验证,实现类似有监督的机器学习


通过这种模式,检察官可以完善和扩展案卡项涉及的内容,并在此基础之上形成一些审查意见,达到从海量的电子数据取证报告中找出所能证明指控犯罪事实的那几条关键信息,并通过大量积累发现隐藏的事实,同时还可以通过对整个过程的了解提出补充侦查的意见。


通过有监督的学习和验证,实体识别、行为识别的卷积算法得到进一步完善和科学,输出实体、行为时越来越精准,形成良性循环。


不过,其中很多要素如规则体系和罪名案由库等都需要长期积累,才能更加准确地判断数据体现正常和异常的关键点。


赵宪伟总结道,进行人工智能算法部署时也有一些担心,很多地方检察院分管相关工作的领导能否对这样一套模式有足够的重视和认识;其实只要能够做到将侦查部门移送的数据平台化这样简单的事情,后面的部署就可以顺理成章进行。


检察官要对移送来的电子数据建立审查的概念,因此第一步就是要能建立平台化的环境,让检察官用自己的电脑就能访问所办理案件的电子数据并极大提高其工作效率。


将电子数据平台化的好处还在于可以将检察官审查的经验记录并传承下去。平台可以告诉检察官在办理某案由的犯罪案件时其他检察官曾经集中搜索过什么要素,以此定位关键词以确定案件的性质。


此外,从海量电子数据筛选出最直接清晰的要素,形成筛选报告展示检察官要指控的犯罪事实,可以将其直接作为刑诉法规定的直接证据使用。




与谈环节

与谈人:石青川


石青川以她办理的一起虚开发票案件的整个审查过程,通过检察官在审查案件时的切入角度,体现检察官对检察技术人员支持的需求。
石青川介绍了一个典型的利用网络实施犯罪的案件,涉案人员大部分通过即时通讯软件沟通,某销售公司内部核查时发现没有相应销售收入、却有大量普通机打发票被开具,从而发现了涉案的三个嫌疑人。案件中筛查出的2000多张、总金额累计超过1亿元的发票,如何认定是这三个嫌疑人所为,需要证据予以支持。
对于办案的一线人员,也就是需要通过审查将“证据材料”确定为可以用于定罪的“证据”。如何认定涉案人员在整个犯罪中发挥的作用、全部2000多张发票是否都需要由他们承担责任、他们是联手共同犯罪还是有部分相对独立实施犯罪等问题,仅依靠嫌疑人的供述和现有实物证据不能完全证实。
此案中如何确定三个人的共同犯罪的地位和作用成为了至关重要、需要解决的问题。检察官推测,即时通讯软件中的信息可能就存有能够证明犯罪的证据。
检察官邀请技术人员一起审查案件,经过海量信息的检索分析,并依此指导后续的侦查。本案从嫌疑人的手机中获取了50多万条聊天记录,筛查后确定了嫌疑人在团伙中互相沟通联系的过程,确定其行为特点和每个人具体的犯罪参与程度。
其中,一个关键的表格被提取出来,检察技术人员敏锐地发现这一表格截图呈现出电脑端微信程序发送文件的特点,通知检察官后立刻要求侦查机关查找、封存嫌疑人使用过的电脑。
随后,检察技术人员陪同检察官,指导公安机关及公安机关聘请的鉴定取证机关对电脑中的数据进行固定,提出明确的取证要求,最终发现了关键表格,这份证据指向犯罪团伙中其他嫌疑人所涉及的发票的金额、张数、发票来源和去向等信息。
该证据的调取对本案的最终认定发挥了重要作用。尤其是对其中一名嫌疑人从一开始传统取证方式核实的涉案发票金额30多万,追加到了9700多万。嫌疑人在这些证据面前均表示认可和认罪认罚。
对于有关证据,向律师说明了取证的完整性和合法性后,律师也表示认可,最终三人均认罪认罚且没有提出上诉。

石青川认为,基于新证据的调取以及对海量数据审查,检察机关取得了非常好的公诉的效果。但还是有些案件中的海量数据审查的工作,没有对后续检察官的审查提供有效的帮助,因此她提出了几点经验与大家分享:
第一,检察官对海量电子数据审查要有最基本的证据意识和加强取证的意识。基层检察人员的设备条件、人员专业电子证据的基础背景有限,导致没有可能或碍于条件无法发现应有的证据。检察人员、技术人员和法官都需要一些简单而又专门的筛查软件工具以满足办案的基本需求。
第二,某些侦查机关在取证意识方面还是大量依赖第三方,仅能做到数据固定的工作,缺少分析研判,导致侦查效果有限,效率较低,侦查取证需要在检察院的审查期内完成。借助检察技术人员,通过专业平台可以对海量数据进行高效筛查,与检察官和公安人员互通有无,对案件的后续侦查提供了重要的技术和证据的支持。
第三,检察技术人员的稀缺性和专业技术的水平,决定了他们在帮助检察官技术审查时发挥的作用高低。长期与检察官共同审查案件的技术人员其实已经是“半个检察官”,经验丰富的技术人员能够给检察官提供更专业的指导方向,使得案件审理的进程快速顺利推进。然而,在检察机关改革的背景下技术人员有所流失,保持技术人员数量的相对稳定,和他们参与办案的程度,对将来新入职的检察官们起到非常重要的作用。



与谈人:刘坤


刘坤以《海量电子数据的审查常见问题与应对》为题展开她的分享。


一、常见问题及应对


(一)收集、提取、审查方式


1、海量电子数据提取困难,多以打印、拍照等形式呈现,忽视原始电子数据的收集审查

公安机关在办案时采用打印、拍照或录像的方式固定电子数据,检察官也更多习惯于审查这种直观的照片、聊天记录截图等,而忽视了对原始电子数据的收集和审查。电子数据的客观性也即其真实性和完整性是其他证据形式不能替代的。


关于电子数据收集和提取的法定途径在《公安机关办理刑事案件电子数据取证规则》第8条和第16条等规定中都有详细的表述。检察官应当树立“原始存储介质能够扣押时及时扣押”的原则意识,以现场或在线提取电子数据为例外,更以打印、拍照、录像作为补充手段。


2、忽视电子数据来源审查

电子数据的来源主要分为三类:第一种是当事人提供,尤其突出表现在跨区域涉众性的电信网络诈骗犯罪中公安机关让当事人自行将聊天和转账记录截图提交;第二种是提取,即公安机关在现场勘察时从手机电脑这种存储介质中提取电子数据;第三种是调取,即由腾讯网易等第三方数据平台提供相应的记录。检察机关审查时要注意区分不同的数据来源。


3、未以可视化方式呈现

办案中接收的电子数据多是存储数据的光盘或硬盘,而这些数据多以代码符号的方式呈现,对于检察人员来说审查存有一定的难度。


4、忽视附属信息的提取

公安机关调取证据和检察机关审查证据过程中对于文件、文档本身的属性、制作人、发件人、传递的路径等附属信息往往比较忽视,但其实办案中常常附属证据反而是定案的关键证据。


例如某侵犯商业秘密案件定案的关键是行为人有无权限下载公司的技术秘密,但公安机关仅对技术秘密进行了同一性比对,而未对技术专网进行现场勘察以获知当时网络环境中所有人员的权限,后来检察机关审查时已不具备条件,给审查带来很大困难。


应对措施——对取证方式和证据来源的判断

刘坤介绍,对于“转换版”的数据是否应当采用,在审查逮捕阶段因期限紧张,一般类型犯罪如果证据来源明确、争议不大的,可以先采用,后续再补证;若是非法集资类等涉众型犯罪,则应结合其他在案证据综合考量,如果影响到案件定性更应审慎判断。在审查起诉阶段一定要转换证据意识,强调对电子数据的审查。


(二)登记原始存储介质不唯一(人机同一性)


公安机关扣押原始存储介质时通常仅标记其名称和特征,但没有进行唯一性登记,这直接影响到对人机同一性的审查。传统的犯罪模式是人表达行为,然后通过行为确认犯罪。


但是信息网络时代的犯罪模式则是人操作机器生成了数据,数据表达这个人的行为,所以首先要把人和机器之前的关联性予以确定,也就是人机同一性。


刘坤提醒,在海量电子数据审查当中,尤其是扣押了众多的原始介质的情况下,一定要登记它的唯一性标识,检察官审查案件时就可以快速锁定其来源和嫌疑人的犯罪行为。


(三)海量电子数据移转环节有漏洞


以“快播”案为例介绍,涉案四台服务器的扣押、移交过程中,执法机关只登记了服务器接入互联网的IP地址,未记载服务器的其他特征,而公安机关鉴定人员在流转过程中错误地记载了存储电子数据硬盘的数量和容量,合议庭人员认为现有存储淫秽视频的服务器是否为原始扣押的服务器、是否由快播公司实际控制使用无法排除合理怀疑。


海淀法院进一步要求公安机关和检察机关调取了快播公司与深圳高新区信息网络有限公司的上网专线协议,确认该IP地址为快播公司专用IP地址


同时,鉴定人员经对四台服务器内现存快播独有视频格式文件qdata文件属性等各类信息的检验分析,未发现2013年11月18日(海淀区文委查扣涉案服务器的时间)后有从外部拷入或修改qdata文件的痕迹,认定检材合法有效。


刘坤表示,从这个案子要吸取的经验就是如果在数据流转的过程当中,把服务器进行准确登记,把人机同一性进行准确对应,可能这个困扰就不会再出现了。


此外,刘坤还简单介绍了如何审查移送过程中的完整性校验值,原始存储介质是否处于封存状态、具有无线通信功能的介质是否采取了信号屏蔽等措施、检查时是否通过写保护的设备接入、是否对数据进行镜像备份,以及瑕疵电子数据的可采用性问题等一系列审查要点。


(四)检验报告/鉴定意见不权威


关于检材可能存在:检材的来源、取得、保管、送检不符合相关法律、规定,与收集提取笔录、扣押清单不相符;


关于人员/机构可能存在:无资质、不在执业范围内、尚处复审期限内;


关于各要素可能存在:取证要求、过程不符合相关国家标准、方法、规范;鉴定工具与鉴定对象混同;


关于意见结论可能存在:与委托需求不对应。


刘坤还指出,电子数据检验报告应当是事实判断,不应对一些概念如“公民个人信息”“淫秽物品”等进行判断,从严格意义上讲这属于法律判断的范畴。


刘坤介绍了四种关于鉴定意见冲突的处理方式:


第一,对比鉴定意见所依据的检材、选用的技术标准、技术规范和技术方法、软件工具(版本)、分析论证过程、复核意见等因素;


第二,询问鉴定人员在鉴定过程中是否向本机构以外的相关专业领域的专家进行咨询,考虑专家提供的咨询意见;


第三,考虑同一份鉴定意见中,对鉴定结论有不同意见的鉴定人员的意见;


第四,在符合重新鉴定的情形下,重新委托司法鉴定机构开展鉴定。


二、检察人员在审查判断海量电子数据中的需求


刘坤将检察人员在审查判断海量电子数据中的需求分为以下5类:


(1)精准的数据检索工具:可以帮助检察官在海量数据当中精准定位需要的内容,大大节省审查时间。


(2)专业数据分析工具、模型、软件:在浏览、过滤、搜索、标记、统计等功能的基础上,融合了人工智能的经典算法。


(3)电子数据的可视化、科学化表达:在两方面促进检察官办案,一是把枯燥晦涩的电子数据的代码符号转化成更可视的表达,方便检察官审查电子数据,


二是把电子数据形成了科学的可视的思维导图、动态演示、行为轨迹图,在出庭公诉的过程当中就能以更简洁易懂的方式呈现给法庭,有力提升出庭指控的效果。


(4)专业的技术辅助:要解决的一个问题是去行政化,真正打通专业技术和检察办案相融合的最后一个关卡。


(5)专业化培训、技术与业务的同堂培训:提升检察官审查电子数据的专业化水平。


刘坤最后总结:电子数据将逐步并最终成为刑事案件审查认定的“证据之王”,如何构建电子数据的科学表达,让现代科技为司法实践提供精准服务,提升办案质效是我们检察人员和技术人员共同努力的一个方向。



与谈人:顾伟


顾伟以“海量电子数据”和“审查”两个关键词分享了他的一些想法,从公诉人办案的实操层面提出他们的需求和困扰,希望可以和技术人员提出的功能化建议擦出火花。


一、海量电子数据类型


海量电子数据可以归为两大类,一类是“海量且同质”的数据,另一类是“海量不同质”的数据。


海量不同质的数据指的是数据总量大,如一部手机中同时存有聊天记录、图片、通话记录、日志信息等,检察官的目的是要精准定位,厘清主线中的某一个环节,力求与其他证据形成对应性,这时可能几十个GB的数据中只需要找到其中一两条就能解决问题。


以最高检检例68号案为例,虽然数据库的体量很大但只要比对其中一些代码日志或时间、数据类型就能确定犯罪事实。因此,针对海量不同质的证据,检察机关或者公诉人在办案中更多是提供一个方向和思路,确定证据定位的问题和证据综合运用的目的。


海量同质的证据指的是单一数据库体量比较大,如某侵犯公民个人信息案件中涉案文件有近2万个,鉴定人员无法将其全部导入表格进行审查或没有软件能解析这样大的数据库,因此最后检察人员只能退而求其次,以抽样验证的方法确认了公民个人信息在几十个文件中的存在,并将其他没有进行完全审查的部分作为量刑情节考虑。


因此对于单一数据库体量特别大的情况,检察机关更多的是要做数量的累加或者排除合理怀疑,确定数量和情节,进行综合的犯罪事实认定。公诉人可以提供一些建模和计算的意见方法,达到筛选和统计学上的结论效果的目的。


二、海量电子数据的审查


基层办案面对这两种海量数据往往在审查中遇到的问题是看不到、看不全、看不懂。“看不到”指的是取证软件兼容性问题导致取证不全面,如无法对附属信息和取决于全案证据作全部提取;“看不全”指的是对提取手机中的语音聊天和图片信息可能无法第一时间打开和查看;“看不懂”则最为关键,即办案人员技术能力不够,对证据审查缺乏专业化能力,提取的海量证据缺少和其他证据的印证关系,证据使用效率较低、无法得出科学化结论。


(一)如何“看到”和“看全”证据


重点在于全面举证、科学化取证和合法化取证,以及取证技术和兼容性的提升。涉及海量电子数据取证时,首先检察机关应扩大提前介入的范围,与公安机关加强配合;其次公安机关取证能力、检察机关自行侦查、检察技术都需要自我提升,落实取证效率、兼容性和取证效果。


(二)如何“看懂”证据


看懂证据包括两个方面,涉及审查的方法和审查的目的:一是检察官作为审查主体要看懂证据,二是能让其他参与诉讼的人如法官、辩护人、被告人、旁听人员等都能看懂检察官出示的证据。


对于检察官来说,需求主要分为数据的检索、关联性的分析、鉴定的审查三个部分。

数据检索方面期待可以进行智能化搜索,即在大量聊天记录中可以运用关键词搜索;基于此还可以进行一些多关键词的模糊性搜索,类似于自我学习的大数据推送,提取关联关键词及其相关内容;进而进行多模块化的构建,也即了解某一天某一部手机所有的软件使用记录可以直接抽离出来,以提高检索效率。


数据分析方面希望数据分析软件可以分为“基础款”和“进阶款”,例如基础款可以在导入交易后自动生成关于银行卡总交易流水、某一个时间段的转账频次、对象和模式;进阶版可以导入支付宝、微信等第三方的交易流水以及笔录、书证的内容,辅以人工智能分析建立模型,找到证据的关联性最终实现资金穿透。


公诉人除了自己找证据,还要对已有的海量数据得出的鉴定结论审查真实性、完整性、科学性,进而能被法庭采纳。公诉人自己对鉴定意见的实质性审查还可以面对庭审冲突时有预案和准备,例如提前自行验算了数据的哈希值以确保真实性。检察业务人员需要和检察技术人员有更加密切的沟通和学习。


让别人看懂证据,即证据要有可回溯性和证据的智能化展示。例如爬虫案需要直观化展示才能更具有庭审的说服性,否则只是枯燥的理论观点的辩驳。


解决办法有两个,一是数据的智能化展示,即将鉴定结论通过科学化的展示将嫌疑人非法的手段展现出来,使得出示证据更全面和更有说服力,同时要注意防止变相传授犯罪方法的风险;二是技术辅助开庭,即开庭时技术人员从实用性、操作性的角度帮助检察官解决专业化问题、作专业化解读和临场应对。



与谈人:陈思远


 陈思远从三位主讲人撰写的《海量电子数据审查的实现路径》中的“电子数据分析精准需求”部分得到启发,以《用程序开发的思维快速把握电子数据分析精准需求》为题展开他的一些想法。


他从程序员的角度分析电子数据,其实对应的就是存储介质、组成原理、编译原理、算法设计和网络原理等,用三个案例分析如何快速帮助检察官并精准分析其需求。


案例一:APP卸载恢复——嫌疑人使用某境外通讯软件进行违法软件交易,但在手机被提取时该软件已经卸载,仅仅查看手机鉴定报告无法发现这个软件。


从程序员的角度出发查看镜像文件结构即可发现曾经装载过该软件,进而发现了制作和销售违法软件的途径和资金走向。


案例二:APP反编译——承办人不能确定某非法提供计算机信息系统程序工具案的嫌疑人一共出售了多少计算机程序。


站在程序员的角度思考如何在手机APP中通过激活码控制登录权限,发现通过反编译可以找到保存发起人、管理人、审批人等不同角色控制登录权限的数据库,最终统计到了售卖的数量。嫌疑人虽然自己都不太能准确统计但看到详细的清单就表示认罪认罚。


案例三:数据库寻找关键信息——鉴定机构下载某非法经营的公司数据库后台数据十分缓慢,程序员则根据拿到的库表先将数据库文件搭建起来,发现后台数据就是以简单的英文和汉语规则命名,可以猜出大概的含义,进而在网站还没有重建时就已经提前找到了涉案的合同详细信息。


总而言之,关键证据的快速锁定、查询和审查需要技术人员有一定的开发思维,平时勤动手做一些代码联调、知道代码运行的原理,可以更好地理解每个电子数据的含义。


从办案的角度,也要有业务思维和开发思维的结合,可以从源头想清楚案件的全过程,提高办案效率和质量。



总结

作为总结,刘品新教授阐述了本次论坛带给他的四点启发:


一、要进行观念更新。全国检察机关在提速进行检察大数据建设,特别是重新塑造检察大数据战略思维,大数据人工智能同检察办案并不遥远,其实每个案件都有海量的数据,都体现出人工智能的算法的影子。


二、要在实践中进行创新。今天大家提到了很多软件开发的问题,需要检察系统有软件设计;有检技合作团队问题,需要建立专门的办案团队;有些同志在从事数据审查员的工作,需要我们在这个领域也进行相应的创新。


三、要进行理论创新。海量数据的审查显示出海量数据审查中的模型算法的理论研究、智慧司法的迭代、数据治理,以及检察办案如何推动社会治理智能化问题,这些理论研究的课题需要我们完成。


四、要进行制度创新。除了专业同步辅助审查这样的工作指南要建成制度以外,可能还需要建立其他的制度指南、其他制度的建设。


编辑|任司东

排版|赵希娅


更多资讯,请关注

刘品新|网眼观法

以网观法|以网思法|以网学法


以下点击可读:
刘品新、张志婧、李鹏、郭树正:如何理解电子证据的多元关联律?——龚某某侵公案的总结与点评
预告 | 赵宪伟、刘政、徐衍、刘品新等:破解电子证据时代的挑战——海量电子证据如何审?
刘品新、黄丽娟、李学军、裴炜、侯爱文、艾行利、石鹏、高显嵩:《电子证据法》的基本思维及品读
刘品新:论区块链证据 | 提前展示的精美课件 | 法大“证据科学春季论坛”第一讲
何家弘、刘品新《证据法学》“大修”至第七版之前言:一起研习证据法学
实录 |电子证据与网络犯罪检察论坛 | 汪珮琳、王铼、刘品新:网络犯罪可疑交易分析与打击洗钱犯罪
刘品新:电子证据法的基本思维
刘品新:电子证据plus规则,绝非“任人打扮的小姑娘”
刘品新、唐超琰 | 穿透式取证:涉众型经济犯罪的法律应对
刘品新、石鹏、高显嵩、张洪铭、安柯颖、侯爱文、彭文昌、王华伟、于冲、朱桐辉 | 周泰研究院电子数据法与网络法研讨观点集锦
新媒首发 | 人大博士生陈丽:电子证据的完整性从属于真实性吗?否

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存